بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو

نویسندگان

چکیده مقاله:

بسط پرس‌وجو به‌عنوان یکی از روش‌های انطباق پرس‌وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می‌دهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرس‌وجو است که فرض می‌کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس‌وجو هستند و کلمات بسط را از این اسناد انتخاب می‌کند. درحالی‌که ممکن است اسناد نامرتبط به پرس‌وجو در اسناد رتبه‌بالا وجود داشته باشد. روش‌هایی برای انتخاب اسناد مرتبط و نادیده گرفتن اسناد خطا از اسناد رتبه‌بالا ارائه‌شده است که از خوشه‌بندی و یا طبقه‌بندی اسناد استفاده کرده‌اند. مهم‌ترین موضوع در بسط پرس‌وجو، انتخاب کلمات بسط از مرتبط-ترین اسناد است. در این مقاله ما خوشه‌بندی اسناد شبه بازخورد را براساس شباهت حساس به پرس‌وجو ارائه می‌کنیم که در قرار دادن شبیه‌ترین اسناد در کنار هم مؤثر است. شباهت حساس به پرس‌وجو که نسبت به شباهت مبتنی بر کلمه نتایج بهتری را در بازیابی اسناد بدست آورده است، دلیل استفاده در این مقاله است. خوشه‌ها را مطابق با شباهت درونی‌شان رتبه‌بندی کرده و تعدادی از خوشه‌های رتبه‌بالا را برای بسط انتخاب می‌کنیم. کلمات بسط را از اسناد خوشه‌های انتخاب‌شده، براساس تابع رتبه‌بندی TF-IDF استخراج می‌کنیم. آزمایش‌های انجام‌شده روی مجموعه‌داده‌ی پزشکی MED نشان می‌دهد که نتایج جستجو برای پرس‌وجوهای بسط‌داده‌شده با اسناد انتخاب‌شده از خوشه‌ها، نسبت به روش بازخورد شبه مرتبط (PRF) و بازیابی اولیه (VSM) بهتر است و اثربخشی جستجو را افزایش می‌دهد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

اثربخشی بسط پرس وجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم k-nn

بسط پرس وجو یکی از روش های مؤثر در بهبود اثربخشی نتایج بازیابی اطلاعات است. روش بازخورد شبه مرتبط (prf) فرض می کند که اسناد رتبه بالا از نتایج اولیه بازیابی شده مرتبط به پرس وجو است و تعدادی کلمه مرتبط را از اسناد رتبه بالا برای بسط انتخاب می کند. وجود اسناد نامرتبط در بین اسناد رتبه بالا محققان را به ارائه روش هایی برای انتخاب بهترین اسناد به عنوان منبع برای انتخاب کلمه بسط سوق می دهد که انتخا...

متن کامل

بررسی و مقایسه روش های انطباق و بهبود پرس وجو برای موتورهای جستجو در محیط وب

پرس وجوهای مبهم و کوتاه ارسالی به موتور جستجوها، به بازیابی نتایج غیرمرتبط منجر می شود. روش های انطباق پرس وجو سعی می کنند تا پرس وجوها را ابهام زدایی کنند و پرس وجو را با نیازهای اطلاعاتی کاربر منطبق کنند. بسط پرس وجو یکی از روش های انطباق پرس وجو است که سعی دارد کلمات مرتبطی را به پرس¬وجو اضافه کند، که می توان کلمات بسط را به صورت محلی و سراسری انتخاب کرد. بسط پرس وجو معمولا کارایی سامانه های...

تحلیل نیرو و تنش دستگاه پرس دومرحله در کاربرد با قالب متعلق به پرس یک‌مرحله

دستگاه‌های پرس صنعتی از نظر مکانیزم به دو گروه اصلی تک‌عمله (تک‌مرحله) و دوعمله (دومرحله) تقسیم می‌شوند. دستگاه پرس تک‌عمله یک مکانیزم اصلی دارد که سنبه را هدایت می‌کند. پرس دوعمله علاوه بر مکانیزم ذکر شده، دارای مکانیزم ورق‌گیر نیز هست. قالب دستگاه دوعمله، وزن و در نتیجه هزینه بالاتری نسبت به قالب دستگاه تک‌عمله دارد. در برخی از موارد، قالب کوچک پرس تک‌عمله را برای پرس دوعمله به کار می‌گیرند، ...

متن کامل

حفظ حریم خصوصی در انتشار سوابق پرس وجو با استفاده از یک روش ریزتجمیع معنایی مبتنی بر رفتار کاربر

روش های مختلفی برای بی نام سازی لاگ های پرس وجوهای متعلق به موتورهای جستجو پیشنهاد شده اند که در میان آنها، روش های مبتنی بر روش ریزتجمیع از نظر حفظ سودمندی داده ها بهترین عملکرد را دارند. در این پایان نامه روشی جدید به نام folkanonymizer برای ریزتجمیع معنایی لاگ های پرس وجو ارائه شده که با توجه به اهداف جستجو و تمایلات پیمایشی کاربران، داده ها را بی نام سازی می کند. این روش، با استفاده از فول...

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

تحلیل نیرو و تنش دستگاه پرس دومرحله در کاربرد با قالب متعلق به پرس یک مرحله

دستگاه های پرس صنعتی از نظر مکانیزم به دو گروه اصلی تک عمله (تک مرحله) و دوعمله (دومرحله) تقسیم می شوند. دستگاه پرس تک عمله یک مکانیزم اصلی دارد که سنبه را هدایت می کند. پرس دوعمله علاوه بر مکانیزم ذکر شده، دارای مکانیزم ورق گیر نیز هست. قالب دستگاه دوعمله، وزن و در نتیجه هزینه بالاتری نسبت به قالب دستگاه تک عمله دارد. در برخی از موارد، قالب کوچک پرس تک عمله را برای پرس دوعمله به کار می گیرند، ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 14  شماره 47

صفحات  243- 254

تاریخ انتشار 2017-01-20

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023